Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
松本 和也*; 井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進
Journal of Supercomputing, 75(12), p.8115 - 8146, 2019/12
被引用回数:2 パーセンタイル:24.73(Computer Science, Hardware & Architecture)ジャイロ運動論的トロイダル5次元オイラーコードGT5Dにおける反復法線形ソルバの性能向上に向けて省通信一般化最小残差法(CA-GMRES)をCPU-GPUハイブリッドクラスタで実装した。CA-GMRESに加え、計算量を削減するために我々が提案した修正版CA-GMRES(M-CA-GMRES)の実装と評価も行った。本研究から、集団通信回数の最小化と密行列積演算による高効率演算というCA-GMRESの利点が実証された。性能評価は1ノードあたりNVIDIA Tesla P100 GPU4台を搭載したReedbush-L GPUクラスタで実施した。この結果、M-CA-GMRESによりCA-GMRES, 一般化共役残差法(GCR), GMRESに比べてそれぞれ1.09x, 1.22x, 1.50xの高速化が示された。
今村 俊幸
Journal of Supercomputing, 15(1), p.95 - 110, 2000/00
被引用回数:2 パーセンタイル:30.03(Computer Science, Hardware & Architecture)本論文では分散メモリ型並列計算機に効果的な、縦ブロック分割の並列LU分解(VBPLU)について報告する。本手法は、ブロックアルゴリズムと通信の集団化という二つの最適化手法に基づいており性能向上が見込める。さらに長ベクトル演算を保障する点でベクトル計算機向けと予想できる。論文ではLog GPやSAD等で知られる並列化モデルに基づいた精密なモデル化を行うとともに、ブロック分割によって生じる負荷分散に関する一考察を与えている。さらに実機上での実験を通じてその結果の有効性を示し、スカラ機上で起こるキャッシュの問題について一解釈を与えることができた。VBPLUで行った解析手法は、ライブラリやコンパイラによるアルゴリズムの自動最適化に応用可能なものと考えられる。